智能论文笔记

DeepSNR: A deep learning foundation for offline gravitational wave detection

Michael Andrews , Manfred Paulini , Luke Sellers , Alexey Bobrick , Gianni Martire , Haydn Vestal

分类：机器学习

2022-07-11

迄今为止，引力波发现的所有科学主张都依赖于候选观测值的离线统计分析，以量化相对于背景过程的重要性。 Ligo实验中这种离线检测管道中的当前基础是匹配的滤波器算法，该算法产生了基于信噪比的基于信噪比的统计量，用于对候选观测进行排名。现有的基于深度学习的尝试检测引力波，这些尝试在信号灵敏度和计算效率（计算效率）中都表现出了输出概率分数。但是，概率分数不容易集成到发现工作流程中，从而将深度学习的使用限制为迄今为止的非发现的应用程序。在本文中，引入了深度学习信噪比（DEEPSNR）检测管道，该检测管道使用了一种新方法来从深度学习分类器中生成信噪比排名统计量，从而为使用提供了第一个使用的基础在面向发现的管道中的深度学习算法。通过从第一次观察运行中识别二进制黑洞合并候选者与噪声源相对于噪声源来证明DeepSNR的性能。使用Ligo检测器响应的高保真模拟用于在物理观察物方面介绍深度学习模型的第一个灵敏度估计。还研究了在各种实验方面的DeepSNR的鲁棒性。结果为DeepSNR用于在更广泛的背景下的引力波和罕见信号的科学发现铺平了道路，从而有可能检测到昏迷的信号和从未被观察到的现象。

translated by 谷歌翻译

Clustering above Exponential Families with Tempered Exponential Measures

Ehsan Amid , Richard Nock , Manfred Warmuth

分类：机器学习

2022-11-04

The link with exponential families has allowed $k$-means clustering to be generalized to a wide variety of data generating distributions in exponential families and clustering distortions among Bregman divergences. Getting the framework to work above exponential families is important to lift roadblocks like the lack of robustness of some population minimizers carved in their axiomatization. Current generalisations of exponential families like $q$-exponential families or even deformed exponential families fail at achieving the goal. In this paper, we provide a new attempt at getting the complete framework, grounded in a new generalisation of exponential families that we introduce, tempered exponential measures (TEM). TEMs keep the maximum entropy axiomatization framework of $q$-exponential families, but instead of normalizing the measure, normalize a dual called a co-distribution. Numerous interesting properties arise for clustering such as improved and controllable robustness for population minimizers, that keep a simple analytic form.

translated by 谷歌翻译

Layerwise Bregman Representation Learning with Applications to Knowledge Distillation

Ehsan Amid , Rohan Anil , Christopher Fifty , Manfred K. Warmuth

分类：机器学习

2022-09-15

在这项工作中，我们提出了一种新颖的方法，用于对训练有素的神经网络学习。特别是，我们根据层的传输函数形成Bregman的差异，并通过合并平均向量并将主方向归一化，并构造原始Bregman PCA公式的扩展，并将主方向归一化，相对于围绕平均值的局部凸功能的几何形状。这种概括允许将学习的表示形式导出为具有非线性的固定层。作为知识蒸馏的应用，我们为学生网络的学习问题提出了预测教师表示的压缩系数，这些内容被作为输入到导入层的输入。我们的经验发现表明，与使用教师的倒数第二层表示和软标签相比，与典型的教师培训相比，我们的方法在网络之间传输信息更为有效。

translated by 谷歌翻译

Intelligent problem-solving as integrated hierarchical reinforcement learning

Manfred Eppe , Christian Gumbsch , Matthias Kerzel , Phuong D. H. Nguyen , Martin V. Butz , Stefan Wermter

分类：人工智能 | 机器学习 | 机器人

2022-08-18

根据认知心理学和相关学科，生物学剂中复杂的解决问题行为的发展取决于等级认知机制。分层增强学习是一种有前途的计算方法，最终可能在人工代理和机器人中产生可比的解决问题的行为。但是，迄今为止，许多人类和非人类动物的解决问题能力显然优于人造系统的能力。在这里，我们提出了整合生物学启发的层次机制的步骤，以实现人造代理中的高级解决问题的技能。因此，我们首先回顾了认知心理学中的文献，以强调构图抽象和预测性处理的重要性。然后，我们将获得的见解与当代分层的强化学习方法联系起来。有趣的是，我们的结果表明，所有确定的认知机制均已在孤立的计算体系结构中单独实施，这提出了一个问题，为什么没有单个统一体系结构可以集成它们。作为我们的最终贡献，我们通过对开发这种统一体系结构的计算挑战的综合观点来解决这个问题。我们希望我们的结果可以指导更复杂的认知启发的分层机器学习体系结构的发展。

translated by 谷歌翻译

TotalSegmentator: robust segmentation of 104 anatomical structures in CT images

Jakob Wasserthal , Manfred Meyer , Hanns-Christian Breit , Joshy Cyriac , Shan Yang , Martin Segeroth

分类：计算机视觉

2022-08-11

在这项工作中，我们着重于（全身）CT图像中多个解剖结构的自动分割。此任务存在许多分割算法。但是，在大多数情况下，它们遇到了3个问题：1。它们难以使用（代码和数据不公开或难以使用）。 2.它们不概括（通常将训练数据集策划为仅包含非常干净的图像，而这些图像不会反映在临床常规过程中发现的图像分布），3。算法只能分段一个解剖结构。对于更多结构，必须使用几种算法，以增加设置系统所需的精力。在这项工作中，我们发布了一个新的数据集和分割工具包，该工具包解决了所有这三个问题：在1204个CT图像中，我们对104个解剖结构（27个器官，59个骨头，10个肌肉，10次肌肉，8艘船）涵盖了大多数相关类别的大部分使用类别案例。我们展示了改进的工作流程，以创建地面真理分段，从而使过程加快了10倍以上。 CT图像是从临床常规中随机采样的，因此代表了一个现实世界数据集，该数据集将其推广到临床应用。该数据集包含各种不同的病理，扫描仪，序列和位点。最后，我们在此新数据集上训练一种细分算法。我们称此算法总节度器，并使其轻松作为验证的Python PIP软件包（PIP安装总节目器）。用法与TotalSmentemator -I CT.NII.GZ -O SEG一样简单，对于大多数CT图像，它都可以很好地工作。该代码可在https://github.com/wasserth/totalsegnsementator和数据集上获得，请访问https://doi.org/10.5281/zenodo.6802613。

translated by 谷歌翻译

Generalized Reinforcement Learning: Experience Particles, Action Operator, Reinforcement Field, Memory Association, and Decision Concepts

Po-Hsiang Chiu , Manfred Huber

分类：机器学习 | 人工智能

2022-08-09

学习涉及时变和不断发展的系统动态的控制政策通常对主流强化学习算法构成了巨大的挑战。在大多数标准方法中，通常认为动作是一组刚性的，固定的选择，这些选择以预定义的方式顺序应用于状态空间。因此，在不诉诸于重大学习过程的情况下，学识渊博的政策缺乏适应动作集和动作的“行为”结果的能力。此外，标准行动表示和动作引起的状态过渡机制固有地限制了如何将强化学习应用于复杂的现实世界应用中，这主要是由于所得大的状态空间的棘手性以及缺乏概括的学术知识对国家空间未知部分的政策。本文提出了一个贝叶斯味的广义增强学习框架，首先建立参数动作模型的概念，以更好地应对不确定性和流体动作行为，然后将增强领域的概念作为物理启发的结构引入通过“极化体验颗粒颗粒建立） “维持在学习代理的工作记忆中。这些粒子有效地编码了以自组织方式随时间演变的动态学习体验。在强化领域之上，我们将进一步概括策略学习过程，以通过将过去的记忆视为具有隐式图结构来结合高级决策概念，在该结构中，过去的内存实例（或粒子）与决策之间的相似性相互联系。定义，因此，可以应用“关联记忆”原则来增强学习代理的世界模型。

translated by 谷歌翻译

Swiss German Speech to Text system evaluation

Yanick Schraner , Christian Scheller , Michel Plüss , Manfred Vogel

分类：自然语言处理 | 人工智能

2022-07-01

我们对瑞士德语的四个市售语音到文本（STT）系统进行了深入评估。该系统在本报告中被匿名化，并称为系统A-D。我们将这四个系统与我们的STT模型进行了比较，该模型之后称为FHNW，并提供了有关我们如何训练模型的详细信息。为了评估模型，我们使用来自不同域的两个STT数据集。瑞士议会语料库（SPC）测试集和新闻领域中的私人数据集，在七个方言区域进行了均匀分布。我们提供详细的误差分析，以检测三个系统的优势和劣势。该分析受两个测试集的特征的限制。我们的模型在两个数据集上均评分了双语评估研究（BLEU）。在SPC测试集中，我们获得了0.607的BLEU分数，而最佳商业系统的BLEU得分为0.509。在我们的私人测试集中，我们获得了0.722的BLEU分数，最佳商业系统的BLEU得分为0.568。

translated by 谷歌翻译

Grounding Hindsight Instructions in Multi-Goal Reinforcement Learning for Robotics

Frank Röder , Manfred Eppe , Stefan Wermter

分类：机器学习 | 人工智能 | 自然语言处理

2022-04-08

本文着重于机器人增强学习，并以稀疏的自然语言目标表示。一个开放的问题是源于自然语言的组成性，以及在感觉数据和动作中的语言基础。我们通过三个贡献来解决这些问题。我们首先提出了一种利用专家反馈的事后视角指导重播的机制。其次，我们提出了一个SEQ2SEQ模型，以生成语言的后代指令。最后，我们介绍了一类新颖的以语言为中心的学习任务。我们表明，事后看来指示可以提高预期的学习绩效。此外，我们还提供了一个意外的结果：我们表明，如果从某种意义上说，代理人学习以一种自我监督的方式与自己交谈，则可以提高代理的学习表现。我们通过学习生成语言指示来实现这一目标，这本来可以作为最初意外行为的自然语言目标。我们的结果表明，绩效增益随任务复杂性而增加。

translated by 谷歌翻译

The Past as a Stochastic Process

David H. Wolpert , Michael H. Price , Stefani A. Crabtree , Timothy A. Kohler , Jurgen Jost , James Evans , Peter F. Stadler , Hajime Shimao , Manfred D. Laubichler

分类：机器学习

2021-12-11

历史流程表现出显着的多样性。尽管如此，学者们长期以来一直试图识别模式，并将历史行动者分类和对一些成功的影响。随机过程框架提供了一种结构化方法，用于分析大型历史数据集，允许检测有时令人惊讶的模式，鉴定内源性和外源对过程的相关因果作用者，以及不同历史案例的比较。随机过程的数据，分析工具和组织理论框架的组合使历史和考古中的传统叙事方法补充了传统的叙事方法。

translated by 谷歌翻译

Increasing Fairness in Predictions Using Bias Parity Score Based Loss Function Regularization

Bhanu Jain , Manfred Huber , Ramez Elmasri

分类：机器学习 | 人工智能

2021-11-05

基于机器学习的决策支持系统的利用率增加强调了导致所有利益相关者准确和公平的预测的必要性。在这项工作中，我们提出了一种新的方法，可以在训练期间提高神经网络模型的公平性。我们介绍了一系列公平性，增强了我们与传统的二进制交叉熵基准损耗一起使用的正规化组件。这些损失函数基于偏置奇偶校验分数（BPS），一个分数有助于使用单个数字量化模型中的偏差。在目前的工作中，我们调查这些正则化组件对偏见的行为和效果。我们在累犯预测任务以及基于人口普查的成人收入数据集的上下文中部署它们。结果表明，对于公平损失功能的良好选择，我们可以减少训练有素的模型的偏置，而不会降低精度，即使在不平衡数据集中也是如此。

translated by 谷歌翻译